24 research outputs found

    Multi-omics integration accurately predicts cellular state in unexplored conditions for Escherichia coli.

    Get PDF
    A significant obstacle in training predictive cell models is the lack of integrated data sources. We develop semi-supervised normalization pipelines and perform experimental characterization (growth, transcriptional, proteome) to create Ecomics, a consistent, quality-controlled multi-omics compendium for Escherichia coli with cohesive meta-data information. We then use this resource to train a multi-scale model that integrates four omics layers to predict genome-wide concentrations and growth dynamics. The genetic and environmental ontology reconstructed from the omics data is substantially different and complementary to the genetic and chemical ontologies. The integration of different layers confers an incremental increase in the prediction performance, as does the information about the known gene regulatory and protein-protein interactions. The predictive performance of the model ranges from 0.54 to 0.87 for the various omics layers, which far exceeds various baselines. This work provides an integrative framework of omics-driven predictive modelling that is broadly applicable to guide biological discovery

    An谩lisis de la v铆a de transducci贸n de se帽al mediada por c-di-GMP en Salmonella: mecanismos de especificidad y regulaci贸n de la movilidad

    No full text
    Salmonella es capaz de adherirse a superficies y formar comunidades de bacterias embebidas en una matriz que ellas mismas han producido denominadas biofilms, que les confiere una mayor resistencia a la desecaci贸n y una mayor tolerancia a agentes antimicrobianos. Salmonella ent茅rica serovar Enteritidis, un pat贸geno alimenticio de gran relevancia tanto cl铆nica como agron贸mica, es capaz de formar biofilms sobre diversos materiales y en diferentes condiciones ambientales. La formaci贸n de biofilms en explotaciones agropecuarias y lugares donde se procesan alimentos es una fuente potencial de contaminaci贸n y transmisi贸n de este pat贸geno. Por ello, es muy importante el desarrollo de nuevas estrategias que impidan la formaci贸n de biofilm o lo desestabilicen por medio de la identificaci贸n de genes esenciales para el proceso de formaci贸n de biofilm y su mantenimiento. Durante las 煤ltimas dos d茅cadas se ha investigado una nueva v铆a de se帽alizaci贸n bacteriana basada en los niveles intracelulares de un dinucle贸tico c铆clico, c-di-GMP, que controla varios procesos en la biolog铆a bacteriana, como la formaci贸n de biofilm. Con el objetivo de conocer la implicaci贸n del c-di-GMP en la biolog铆a de Salmonella el laboratorio de biofilms microbianos trabaja en una l铆nea de investigaci贸n dedicada al an谩lisis de las prote铆nas involucradas en su metabolismo as铆 como de sus efectores celulares, dentro de la cual se engloba el trabajo descrito en esta tesis doctoral. La primera parte de la tesis se ha dedicado al estudio del mecanismo de especifidad de las 12 prote铆nas GGDEF presentes en Salmonella, responsables de la s铆ntesis c-di-GMP en diferentes condiciones desvelando una presencia aparentemente constitutiva de la mayor铆a de ellas. Como esta expresi贸n constitutiva dificulta el an谩lisis de sus funciones individuales, se ha independizada cada prote铆na GGDEF del resto de la familia por medio de la restauraci贸n individual de cada prote铆na GGDEF sobre un mutante m煤ltiple que carece de los 12 genes que codifican prote铆nas GGDEF. Nuestros resultados muestran una expresi贸n similar de las prote铆nas GGDEF en ausencia del resto de la familia. Adem谩s se ha observado que varias prote铆nas GGDEF son capaces de activar la producci贸n de celulosa sugiriendo que no existe una especifidad funcional y que diferentes prote铆nas GGDEF pueden contribuir a un pool globar de c-di-GMP. En el cap铆tulo 2 se han seleccionado dos prote铆nas GGDEF caracterizadas previamente en el laboratorio, SEN1023 y AdrA. Estas dos prote铆nas son capaces de activar la s铆ntesis de celulosa en diferentes condiciones y poseen distintos patrones de expresi贸n. Con el objeto de analizar si la especifidad de estas prote铆nas para activar la producci贸n de celulosa en cada una de estas condiciones se debe a su diferente patr贸n de expresi贸n, se ha realizado un intercambio de los elementos reguladores de la expresi贸n de ambos genes. Los resultados obtenidos muestran que los intercambios realizados no dan lugar a un nivel de expresi贸n equiparable y sugieren la existencia de mecanismos de regulaci贸n post-transcripcional en estos genes.Por 煤ltimo, en el cap铆tulo 3 se ha analizado un fenotipo asociado a la presencia de altos niveles de c-di-GMP en Salmonella, la inhibici贸n de la movilidad. Hasta el momento se hab铆a descrito que la prote铆na PilZ YcgR al unir c-di-GMP, act煤a como un embrague molecular en el complejo 驴switch驴 del flagelo, frenando a la bacteria. En este trabajo hemos construido y analizado varias cepas de Salmonella que presentan altos niveles de c-di-GMP y que son inm贸viles a煤n en ausencia de YcgR con el objetivo de identificar la diana que une c-di-GMP para controlar la movilidad de Salmonella de una forma YcgR independiente. El an谩lisis de mutantes capaces de recuperar la movilidad en presencia de altos niveles de c-di-GMP y ausencia de YcgR ha revelado que mutantes en el oper贸n de la s铆ntesis de celulosa recuperan la movilidad inhibida por el c-di-GMP. Una caracterizaci贸n de este proceso ha demostrado que la presencia de celulosa en la superficie de la bacteria provoca una inhibici贸n completa de la rotaci贸n flagelar. Estos resultados refuerzan estudios previos que indican que el c-di-GMP modula la transici贸n de un modo de vida planct贸nico a un modo de vida s茅sil. Dada la importancia de controlar esta transici贸n de manera eficaz, cuando la bacteria inicia la formaci贸n de biofilm, el c-di-GMP garantiza que la movilidad se bloquee completamente actuando a dos niveles independientes. Por un lado, a trav茅s de la prote铆na YcgR que interact煤a directamente con la maquinaria flagelar y por otro, mediante la s铆ntesis del exopolisac谩rido celulosa que, probablemente a trav茅s de un impedimento est茅rico, asegura que el bloqueo de la movilidad sea completo.Peer Reviewe

    Construcci贸n y caracterizaci贸n de una cepa mutante m煤ltiple en los doce genes GGDEF de Salmonella enteritidis

    No full text
    Ingenier铆a Agron贸micaNekazaritza Ingeniaritz

    Feature and functional enrichment analysis.

    No full text
    <p><b>(A)</b> Mutual information (MI) content for each of the 8 classifiers. The 4166 genes are sorted by decreasing order of their MI. Solid and dashed lines correspond to empirical data and inverse log-linear fitting, respectively. <b>(B)</b> The common set of the most informative genes across different classifiers. For each of the 8 classifiers, genes that account for top 10% of MI of all genes are extracted (side bars depict the size of the corresponding gene set). The top histogram depicts the size of the unique features (genes) per classifier. <b>(C)</b> Functional annotations of the selected features for each classifier. The six most significantly enriched ontology terms are depicted. As some of functional terms were synonyms, we extract the non-duplicated associated terms. Ratios represent the proportion of the specific ontology terms present in a MI gene set.</p

    Gene expression compendium and classification workflow.

    No full text
    <p>The workflow is divided into three steps: <b>(A)</b> data preprocessing that combines RNA-Seq and microarray datasets. <i>EcoGEC</i> is categorized into three differential expression bins (under-expressed, UE; wild-type, WT; over-expressed OE) and pre-processed for batch-effect and bias correction. <b>(B)</b> model training, where parameters are trained based on four different machine learning methods for each of the classification tasks, and <b>(C)</b> model testing where new samples are assigned to the class labels that have the majority of votes from 4 prediction methods for each of the eight characteristic predictors.</p

    Highly informative genes on a genetic interaction network.

    No full text
    <p><b>(A)</b> Genes are grouped into five separate modules that are distinct from the core network. Ontology of pathways and compositions of transporter complexes are based on EcoCyc for <i>E</i>. <i>coli</i> K-12 MG1655. Green edges represent genetic interactions identified in [<a href="http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1004127#pcbi.1004127.ref047" target="_blank">47</a>]. Histograms show frequencies of MI genes for different classifiers for 5 pathway modules. <b>(B)</b> A higher resolution representation for the biosynthesis and transporter complex pathways that are highly enriched in a number of classifiers. Genes shown are the top-ranked in each classification task. The node color denote the classification task that it is highly informative of (task legend on the upper right of the figure).</p
    corecore